# 生成知识提示

import { Screenshot } from 'components/screenshot'
import GENKNOW from '../../img/gen-knowledge.png'

<Screenshot src={GENKNOW} alt="GENKNOW" />

图像来源：[Liu等人, 2022](https://arxiv.org/pdf/2110.08387.pdf)

LLM仍在不断改进，其中一种流行的技术是能够整合知识或信息，以帮助模型作出更准确的预测。

使用相似的想法，模型是否也可以在做出预测之前生成知识呢？这正是[Liu等人，2022](https://arxiv.org/pdf/2110.08387.pdf)试图实现的内容——生成知识作为提示的一部分。特别是，在常识推理等任务中，这对于提高准确性有多大帮助？

让我们试试一个简单的提示：

*提示:*
```
高尔夫的一部分是试图得到比其他人更高的得分。是或否？
```

*输出:*
```
是的。
```

这种错误揭示了LLM在执行需要更多世界知识的任务时的局限性。我们如何通过生成知识来改善这种情况呢？

首先，我们生成了几个“知识点”:

*提示:*
```
输入：希腊比墨西哥大。
知识：希腊约为131,957平方公里，而墨西哥约为1,964,375平方公里，使墨西哥比希腊大了1,389％。

输入：眼镜总会起雾。
知识：当汗水、呼吸和环境湿度中的水蒸气着陆在冷表面上、冷却并变成微小的液滴，形成你看到的雾气时，眼镜镜片上就会出现冷凝。您的镜片相对于呼吸来说会比较凉爽，尤其是在外面的空气很冷的时候。

输入：鱼可以思考。
知识：鱼比它们看起来更聪明。在许多领域，如记忆力，它们的认知能力与’更高级别’的脊椎动物包括非人类灵长类相当甚至超过。鱼的长期记忆有助于它们跟踪复杂的社交关系。
```
格式：仅返回翻译内容，不包括原文。输入：在一个人的一生中吸很多香烟的一个普遍影响是患肺癌的风险比正常人高。

知识：那些一生中平均每天吸少于一支香烟的人，患肺癌死亡风险是非吸烟者的9倍。在吸烟量为每天1到10支的人中，患肺癌死亡风险几乎比非吸烟者高12倍。

输入：一块石头和一个小鹅卵石大小一样。

知识：小鹅卵石是根据Udden-Wentworth沉积学尺度而得出的，粒径为4到64毫米的碎石。小鹅卵石通常被认为比砾石（粒径为2到4毫米）大，比卵石（粒径为64到256毫米）小。

输入：高尔夫球一部分是试图比其他人获得更高的得分。

知识:

*知识1：*
高尔夫球的目标是用最少的杆数打完一组球洞。一轮高尔夫球比赛通常包括18个球洞。每个球洞在一个标准高尔夫球场上只打一遍。每一杆都算一分，总杆数用来决定比赛的获胜者。

*知识2：*
高尔夫球是一项精密的球类运动，比赛的参赛者（或高尔夫球手）使用多种类型的球杆将球打入球道上的一系列洞口，并以最少的杆数完成比赛。得分最低的球手获胜，得分是通过计算每个洞口上使用的总杆数来得出的。

我们使用[Liu等人2022年的论文](https://arxiv.org/pdf/2110.08387.pdf)中提供的提示。

下一步是整合知识并进行预测。我将问题重新格式化为QA格式以指导回答格式。

*提示：*
```
问题：高尔夫的一部分是试图比其他人获得更高的得分。是或否？
格式：仅返回翻译内容，不包括原始文本。知识:高尔夫球的目标是以最少的杆数打完一组洞。一般高尔夫球场有18个洞，每个洞在一轮比赛中只打一次。每一杆都算一分，总杆数用于确定比赛的获胜者。

解释和回答：

```
*答案1 (非常确定):*
```
不，高尔夫的目标不是比其他人得分更高。相反，目标是以最少的杆数打完一组洞。总杆数用于确定比赛的获胜者，而不是得分总数。
```

```
问题:高尔夫的一部分是要试图比其他人得更高的分数。 是或否？

知识：高尔夫是一项使用多种类型的球杆将球打入球场上的一系列洞中，尽可能少地击打球的精确度俱乐部球类运动。目标是在最少的杆数下完成比赛，这是通过计算每个洞中所需的总杆数来计算的。总杆数最少的选手赢得比赛。

解释和回答：
```

*答案2 (置信度低得多):*
```
是的，高尔夫的一部分是要试图比其他人得更高的分数。每个选手都试图以最少的杆数完成比赛，这是通过累加每个洞中的总杆数计算出来的。总杆数最少的选手赢得比赛。
```

对于这个例子，一些非常有趣的事情发生了。在第一个答案中，模型非常自信，但在第二个答案中则不然。我为演示目的简化了这个过程，但在得出最终答案时还有更多要考虑的细节。阅读论文了解更多。